Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. = E(ˆθ) και διασπορά σ 2ˆθ = Var(ˆθ).



Σχετικά έγγραφα
ΕΚΘΕΣΗ ΓΙΑ ΤΗΝ ΠΑΡΑΝΟΜΗ ΙΑΚΙΝΗΣΗ ΑΝΘΡΩΠΩΝ

[Σηµ: Ο ένας αστερίσκος σηµειώνει τα άρθρα που αναθεωρήθηκαν το 1986 και οι δύο, αυτά που αναθεωρήθηκαν το 2001]

ΠΡΟΣ: ΚΟΙΝ: ΘΕΜΑ: Ενηµερωτικό σηµείωµα για το πρόβληµα της παράνοµης υλοτοµίας και ειδικά αυτό της καυσοξύλευσης

ΣΑΗΕΝΤΟΛΟΓΙΑ. ηµιουργώντας έναν καλύτερο κόσµο

Ασκήσεις ΙΙΙ Brno

ΓΡΑΠΤΕΣ ΠΡΟΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΙΟΥΝΙΟΥ 2005 ΜΑΘΗΜΑ : ΝΕΑ ΕΛΛΗΝΙΚΑ

/νση: ΧΑΡΑΚΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ Μ. Αλεξάνδρου 49, 66100, ράµα Τηλ&φαξ: , κιν.: info@akademia.

Να µαστε λοιπόν µε καφέ και τσιγάρα στης φίλης µου της Ρίτας,

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΝΑΥΠΗΓΩΝ ΜΗΧ/ΓΩΝ ΜΗΧΑΝΙΚΩΝ. ΘΕΜΑ: Προστασία µε επιµεταλλώσεις. Σκαβάρας Παναγιώτης

ΠΟΛΗ ΚΑΙ ΧΩΡΟΣ ΑΠΟ ΤΟΝ 20 Ο ΣΤΟΝ 21 Ο ΑΙΩΝΑ

Η παρακμή του εργατικού κινήματος είναι μια διαδικασία που έχει ήδη διαρκέσει. πολλά χρόνια, τώρα ζούμε τα επεισόδια του τέλους της.

Σηµειώσεις στις Εµπορικές Εταιρίες

ΕΡΓΑΣΙΑ ΣΤΗ ΝΕΟΕΛΛΗΝΙΚΗ ΛΟΓΟΤΕΧΝΙΑ

O ΑΓΩΝΑΣ ΤΟΥ ΕΦΗΒΟΥ ΓΙΑ ΑΝΕΞΑΡΤΗΣΙΑ

ΑΝΕΞΑΡΤΗΤΟΣ ΙΑΧΕΙΡΙΣΤΗΣ ΜΕΤΑΦΟΡΑΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Α.Ε. ιεύθυνση Συντήρησης Συστήµατος Μεταφοράς Αγ. `Αννης 70, , Αιγάλεω

ΚΕΦΑΛΑΙΟ 9 ΑΞΙΟΛΟΓΗΣΗ ΕΦΑΡΜΟΓΗΣ «ΕΝΑ ΟΝΕΙΡΙΚΟ ΤΑΞΙΔΙ ΣΤΗΝ ΚΝΩΣΟ» - ΠΕΡΙΓΡΑΦΗ ΔΙΑΔΙΚΑΣΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Υποψήφιοι Σχολικοί Σύμβουλοι

Το σύμπαν μέσα στο οποίο αναδύεστε

ΕΚΦΡΑΣΗ-ΕΚΘΕΣΗ Β ΛΥΚΕΙΟΥ 1 ο Λύκειο Καισαριανής ΕΠΑΓΓΕΛΜΑ: Κείμενα Προβληματισμού

ΚΟΡΙΝΘΟΥ 255, ΚΑΝΑΚΑΡΗ 101 ΤΗΛ , , FAX

Περίοδος της Μεγάλης Τεσσαρακοστής Ο Ιησούς περπατά στους δρόμους μας, έρχεται στα σπίτια μας για να μας προσφέρει την πίστη

ΤΜΗΜΑ ΣΥΝΤΗΡΗΣΗΣ ΗΜΟΤΙΚΩΝ αριθ. Πρωτ. Προκ: & ΣΧΟΛΙΚΩΝ ΚΤΙΡΙΩΝ Κ.Α για το 2015

Αναπαραστάσεις των φύλων στα παιδικά αναγνώσµατα του νηπιαγωγείου και του δηµοτικού σχολείου

ΜΑΘΗΜΑ ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΑΣΚΗΣΕΙΣ. Συνέχεια του µαθήµατος 22 Ασκήσεις. 3 η ενότητα 17.

ΕΘΝΙΚΟ ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

Επίσηµη Εφηµερίδα αριθ. C 372 της 09/12/1997 σ

H προστασία της ιδιωτικής ζωής των παιδιών που ζουν σε ιδρύµατα

: Aύξηση φόρου εισοδήµατος, και µείωση µισθών

ΑΜΙΑΝΤΟΣ ΚΑΙ ΠΥΡΟΣΒΕΣΤΙΚΟ ΣΩΜΑ: ΖΗΤΗΜΑΤΑ ΥΓΙΕΙΝΗΣ ΚΑΙ ΑΣΦΑΛΕΙΑΣ

ΠΑΡΟΥΣΙΑΣΗ ΚΑΙ ΚΡΙΤΙΚΗ ΒΙΒΑΙΟΥ

Φάλουν Ντάφα ιαλέξεις πάνω στον Νόµο του Φο ιαλέξεις στις Ηνωµένες Πολιτείες

ΚΕΦΑΛΑΙΟ 8 ΣΥΜΠΕΡΑΣΜΑΤΑ

Οι Βαλκανικοί Πόλεµοι ( ) στα ελληνικά διδακτικά εγχειρίδια Ιστορίας (δευτεροβάθµιας εκπαίδευσης) της περιόδου

Ευρετήριο πινάκων. Ασκήσεις και υπομνήματα

ΙΕΘΝΗΣ ΣΥΜΒΑΣΗ ΕΡΓΑΣΙΑΣ 183 «για την αναθεώρηση της (αναθεωρηµένης) σύµβασης για την προστασία της µητρότητας,»

Διδάγματα από την Επανάσταση του Αξίες για μια Δημιουργική Κύπρο

ΑΠΟΣΠΑΣΜΑ. Από τα πρακτικά της με αριθμό 13ης/2013, συνεδρίασης του Περιφερειακού Συμβουλίου την Τρίτη 9 Ιουλίου 2013 στην Κέρκυρα με τηλεδιάσκεψη.

ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ ΔΙΔΑΓΜΕΝΟ ΚΕΙΜΕΝΟ

Η αξιολόγηση των εκπαιδευτικών το Π.Δ 152/2013, του Γιώργου Καλημερίδη

Αντωνία Αθανασοπούλου

ΤΕΙ ΚΑΛΑΜΑΤΑΣ. ΑΡΓΥΡΗ ΔΗΜΗΤΡΑ Σχολής Διοίκησης και Οικονομίας Τμήμα Χρηματοοικονομικής και Ελεγκτικής Επιστήμης Εισηγητής :Λυγγίτσος Αλέξανδρος

Όμιλος Λογοτεχνίας. Δράκογλου Αναστασία, Κιννά Πασχαλίνα

ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ ΛΟΓΙΣΤΙΚΗ

ΕΞΩΣΧΟΛΙΚΟ ΛΟΓΟΤΕΧΝΙΚΟ ΑΝΑΓΝΩΣΜΑ. Νικόστρατος Ένα ξεχωριστό καλοκαίρι. Κωνσταντίνα Αντωνοπούλου Α2 Γυμνασίου

Απώλεια και μετασχηματισμοί της τραυματικής εμπειρίας. Παντελής Παπαδόπουλος

Εισαγωγή: ακαδηµαϊκά αδικήµατα και κυρώσεις

Επαρχιακός Γραμματέας Λ/κας-Αμ/στου ΠΟΑ Αγροτικής

Ασκήσεις ΙΙΙ Brno

Κεφάλαιο 4 ο Η αριστοτελική φυσική

ΑΚΡΟΒΑΤΗΣ-ΧΑΪΝΗΔΕΣ Οι Χαΐνηδες Ο Δημήτρης Αποστολάκης

Ερευνητές συµµετέχοντες στη συνέντευξη: Θεοδοσοπούλου Ειρήνη, Φραγκούλης Εµµανουήλ

ΠΑΝΕΛΛΗΝΙΟ ΣΟΣΙΑΛΙΣΤΙΚΟ ΚΙΝΗΜΑ ΧΑΡ. ΤΡΙΚΟΥΠΗ ΑΘΗΝΑ ΓΡΑΦΕΙΟ ΤΥΠΟΥ TΗΛ. (210) FAX: (210) pressoffice1@pasok.

ΕΘΝΙΚΗ ΣΧΟΛΗ ΗΜΟΣΙΑΣ ΙΟΙΚΗΣΗΣ ΜΑΘΗΜΑ: ΟΡΓΑΝΩΣΗ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ ΚΡΑΤΟΥΣ (ΣΥΝΤΑΓΜΑΤΙΚΟ ΙΚΑΙΟ)

ΚΑΝΟΝΙΣΜΟΣ ΛΕΙΤΟΥΡΓΙΑΣ ΚΟΙΜΗΤΗΡΙΩΝ

Πρόγραμμα Σπουδών για το "Νέο Σχολείο"

ΑΥΓΟΥΣΤΟΣ 2008 ΥΠΟΜΝΗΜΑ ΤΗΣ ΚΕΝΤΡΙΚΗΣ ΕΝΩΣΗΣ ΕΠΙΜΕΛΗΤΗΡΙΩΝ ΕΛΛΑΔΟΣ ΑΡΧΗΓΟ ΤΗΣ ΑΞΙΩΜΑΤΙΚΗΣ ΑΝΤΙΠΟΛΙΤΕΥΣΗΣ ΚΑΙ ΠΡΟΕΔΡΟ ΤΟΥ ΠΑΣΟΚ

ΓΙΩΡΓΟΣ ΜΠΛΑΝΑΣ ΓΙΑ ΤΟΝ ΑΝΑΡΧΙΣΜΟ

ΣΑΥ - ΦΑΥ ΕΡΓΟΥ. ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΠΕΡΙΦΕΡΕΙΑ ΚΡΗΤΗΣ ΠΕΡΙΦΕΡΕΙΑΚΗ ΕΝΟΤΗΤΑ ΗΡΑΚΛΕΙΟΥ ΗΜΟΣ ΜΙΝΩΑ ΠΕ ΙΑ ΑΣ /νση Τεχνικών Υπηρεσιών.

ΓΙΑ ΝΑ ΠΝΙΞΕΙΣ ΤΟ ΦΙΔΙ ΔΕΝ ΑΡΚΕΙ ΝΑ ΤΣΑΚΙΣΕΙΣ ΤΑ (ΧΡΥΣΑ) ΑΥΓΑ ΤΟΥ

ΟΡΓΑΝΩΣΗ ΠΟΥ ΕΚΠΡΟΣΩΠΕΙΤΕ: ΟΜΟΣΠΟΝ ΙΑ ΕΡΓΟ ΟΤΙΚΩΝ ΕΝΩΣΕΩN ΕΠΙΣΕΙΡΗΣΕΩΝ ΝΑΥΠΗΓΗΣΗΣ ΚΑΙ ΕΠΙΣΚΕΥΗΣ ΠΛΟΙΩΝ ΠΕΙΡΑΙΑ.

Αρείου Πάγου: 699/1995 Τµ. Β' Πηγή:.Ε.Ε. 3/96, σ.299, Ε.Ε.. 55/96, σ.830,.ε.ν. 52/96, σ. 239

Οι μαθητές της ομάδας λογοτεχνίας της βιβλιοθήκης ασχολήθηκαν με το έργο πέντε γυναικών συγγραφέων: Ζωρζ Σαρή, Λότη Πέτροβιτς- Ανδρουτσοπούλου,

Β ΚΥΚΛΟΣ Τ.Ε.Ε. ΝΕΑ ΕΛΛΗΝΙΚΑ. ΚΕΙΜΕΝΟ Μάριος Πλωρίτης Νέοι, ναρκωτικά, βία

ΤΖΟΤΖΕΦ ΚΙΠΛΙΝΓΚ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ ΟΙΚΟΝΟΜΙΑΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Γ. ΙΩΑΝΝΟΥ, «ΣΤΟΥ ΚΕΜΑΛ ΤΟ ΣΠΙΤΙ»

ΠΡΟΣΛΗΨΕΙΣ ΚΑΙ ΕΙΚΟΝΕΣ ΤΗΣ ΕΛΛΑΔΑΣ

Οι 21 όροι του Λένιν

ΚΑΝΟΝΙΣΜΟΣ ΣΠΟΥ ΩΝ ΤΕΙ ΠΕΙΡΑΙΑ (Απόφαση Συνέλευσης ΤΕΙ αριθ. 5/ , ΦΕΚ 816/ , τ. Β )

Δαλιάνη Δήμητρα Λίζας Δημήτρης Μπακομήτρου Ελευθερία Ντουφεξιάδης Βαγγέλης

ΠΛΑΤΩΝΑΣ. 427 π.χ π.χ.

ΕΠΙΧΕΙΡΗΜΑΤΟΛΟΓΩ ΥΠΕΡ Η ΚΑΤΑ ΤΗΣ ΧΡΗΣΗΣ ΤΩΝ ΣΥΜΒΑΤΙΚΩΝ ΤΖΑΚΙΩΝ ΚΑΙ ΤΗΣ ΚΑΥΣΗΣ ΞΥΛΕΙΑΣ ΓΙΑ ΟΙΚΙΑΚΉ ΘΕΡΜΑΝΣΗ

Ο Οδικός Χάρτης για την Ελλάδα της δημιουργίας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΝΟΜΟΣ ΗΡΑΚΛΕΙΟΥ ΔΗΜΟΣ ΓΑΖΙΟΥ

ΣΥΝΕΝΤΕΥΞΗ ΤΥΠΟΥ ΚΩΣΤΗ ΧΑΤΖΗ ΑΚΗ ΑΘΑΝΑΣΙΟΥ ΣΚΟΡ Α

ΘΕΜΑΤΑ ΚΑΝΟΝΙΣΜΩΝ ΒΙΒΛΙΟ ΠΕΡΙΠΤΩΣΕΩΝ ΠΕΡΙΕΧΟΜΕΝΑ

ΘΕΜΑ: «Παραθεριστικοί Οικοδοµικοί Συνεταιρισµοί. Μελέτη Περίπτωσης του «Βραχόκηπου» ήµου Γουβών Ηρακλείου Κρήτης»

Α. KEIMENO Γιώργος Ιωάννου, Το Γάλα (απόσπασµα)

Η Ιστορία του Αγγελιοφόρου Όπως αποκαλύφθηκε στον Μάρσαλ Βιάν Σάμμερς στης 23 Μάιου 2011 στο Μπόλντερ, Κολοράντο, ΗΠΑ

ΟΙ ΘΕΩΡΗΤΙΚΟΠΑΙΔΑΓΩΓΙΚΕΣ ΑΡΧΕΣ ΣΤΗΝ ΠΟΛΙΤΕΙΑ ΤΟΥ ΠΛΑΤΩΝΑ

Κατερίνα Παναγοπούλου: Δημιουργώντας κοινωνικό κεφάλαιο την εποχή της κρίσης

Σηµειώσεις στο ταξινοµούµε

Όταν το μάθημα της πληροφορικής γίνεται ανθρωποκεντρικό μπορεί να αφορά και την εφηβεία.

Ομιλία του Υφυπουργού Ανάπτυξης κου Θανάση Σκορδά στο CapitalVision 2012

ΣΑΗΕΝΤΟΛΟΓΙΑ. ηµιουργώντας έναν καλύτερο κόσµο

Ο «ΕΚΑΛΟΓΟΣ» ΤΟΥ ΚΑΛΟΥ ΥΠΟΨΗΦΙΟΥ

Σοφία Γιουρούκου, Ψυχολόγος Συνθετική Ψυχοθεραπεύτρια

Το 1 ο φύλλο της εφηµερίδας µας, που κυκλοφόρησε τον Οκτώβριο του 1996 και ήταν χειρόγραφο


ΘΕΜΑΤΑ ΝΕΟΕΛΛΗΝΙΚΗΣ ΙΣΤΟΡΙΑΣ ΘΕΩΡΗΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

Αρ. Μελέτης : 14/2015 ΙΑΚΗΡΥΞΗ

Ο τουριστικός οδηγός για τις αυστριακές Άλπεις και λίµνες δηµιουργήθηκε στα πλαίσια του πολιτιστικού προγράµµατος «Ο ελληνικός και ευρωπαϊκός

ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ ΙΑΓΩΝΙΣΜΑ ΝΕΟΕΛΛΗΝΙΚΗΣ ΛΟΓΟΤΕΧΝΙΑΣ ΘΕΩΡΗΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ

Παλιά ήμασταν περισσότεροι. Είμαι βέβαιος. Όχι τόσοι

Συνήγορος του Καταναλωτή Νομολογία ΕφΑθ 5253/2003

Σύνταγμα, Εργασία και Συναφή Δικαιώματα ( Συνδικαλιστική Ελευθερία, Απεργία )

ΧΙΙΙ Επιτροπή Εκπαιδευτικής Υπηρεσίας

Ποιότητα στην πανεπιστηµιακή διδασκαλία:

Απλές λύσεις για άµεση έξοδο από την κρίση. Μέσα σε λίγες ηµέρες µπορεί να σωθεί η Ελλάδα. Αρκεί να ξυπνήσουν οι Έλληνες και να δουν τι συµβαίνει.

ΣΥΛΛΟΓΙΚΗ ΣΥΜΒΑΣΗ ΕΡΓΑΣΙΑΣ. Για τους όρους αµοιβής και εργασίας των Εργαζοµένων στις Ξενοδοχειακές Επιχειρήσεις Νοµού Χανίων

Transcript:

Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Οι στατιστικές δείγµατος που υπολογίζονται από τα δεδοµένα που έχουν συλλεχθεί, όπως η δειγµατική µέση τιµή x και η δειγµατική διασπορά s 2, χρησιµοποιούνται για την εκτίµηση των σχετικών παραµέτρων πληθυσµού (µ και σ 2 αντίστοιχα). Γενικά από τις παρατηρήσεις του δείγµατος µπορούµε να υπολογίσουµε τη σηµειακή εκτίµηση (poit estimatio) και την εκτίµηση διαστήµατος (iterval estimatio) της παραµέτρου µιας τ.µ.. 2. Σηµειακή Εκτίµηση Η σηµειακή εκτίµηση µιας παραµέτρου είναι η στατιστική που υπολογίζουµε από το δείγµα, δηλαδή είναι µια τιµή, που υπολογίζεται µε ϐάση τα δεδοµένα του δείγµατος και αντιπροσωπεύει την πραγµατική τιµή της σχετικής παράµετρου του πληθυσµού. Για παράδειγµα, ο µέσος όρος των 25 τιµών αντοχής ϑραύσης που µετρήθηκαν σε δείγµα 25 σκυροδεµάτων αποτελεί µια σηµειακή εκτίµηση της µέσης αντοχής ϑραύσης σκυροδέµατος (δες Παράδειγµα.2). Εστω X µια τ.µ. µε αθροιστική συνάρτηση κατανοµής F X (x; θ) ή απλά F(x; θ) που εξαρτάται από την παράµετρο θ την οποία ϑέλουµε να εκτιµήσουµε. Εστω ακόµα ότι έχουµε παρατηρήσεις {x,...,x } της X από ένα δείγµα µεγέθους. Τότε η σηµειακή εκτίµηση της θ δίνεται από τη συνάρτηση g(x,..., x ) των τιµών του δείγµατος που λέγεται εκτιµήτρια συνάρτηση. Η εκτιµήτρια (estimator) της θ από το δείγµα είναι ˆθ = g(x,..., x ). Επειδή οι παρατηρήσεις {x,...,x } αλλάζουν κάθε ϕορά που µελετάµε διαφορετικό δείγ- µα µεγέθους, µπορούµε να υποθέσουµε ότι οι παρατηρήσεις {x,...,x } είναι τιµές των τ.µ. {X,...,X }, που είναι ανεξάρτητες µεταξύ τους κι ακολουθούν την ίδια κατανοµή F(x; θ). Άρα η παράµετρος ˆθ είναι συνάρτηση αυτών των τ.µ.. Για ευκολία ϑα χρησιµοποιούµε το συµ- ϐολισµό {x,..., x } και ϑεωρητικά (εννοώντας τις τ.µ. {X,...,X }) και πρακτικά (εννοώντας τις παρατηρούµενες αριθµητικές τιµές αυτών των τ.µ.). Είναι ϕανερό ότι για διαφορετικά δείγµατα (διαφορετικές τιµές {x,...,x }) η εκτιµήτρια συνάρτηση της παραµέτρου ˆθ παίρνει διαφορετικές τιµές, δηλαδή η ˆθ είναι η ίδια τ.µ. µε κάποια κατανοµή κι έχει µέση τιµή µˆθ = E(ˆθ) και διασπορά σ 2ˆθ = Var(ˆθ). ύο σηµαντικές παράµετροι µιας τ.µ. X που ϑέλουµε να εκτιµήσουµε είναι η µέση τιµή µ κι η διασπορά σ 2. 23

24 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Εκτίµηση µέσης τιµής Είναι ϕυσικό ως εκτιµήτρια της µ να ορίσουµε τη δειγµατική µέση τιµή που ορίσαµε στην Παράγραφο.2. x = x i. (2.) Εκτίµηση διασποράς Οπως για τη µέση τιµή έτσι και για τη διασπορά σ 2 η εκτιµήτρια είναι η δειγµατική διασπορά που ορίσαµε στην Παράγραφο.2.2 ως s 2 = (x i x) 2. (2.2) Βέβαια µπορεί κάποιος να ορίσει την εκτιµήτρια της σ 2 ως s 2 = (x i x) 2. (2.3) Οι εκτιµήτριες s 2 και s 2 διαφέρουν µόνο ως προς το συντελεστή του αθροίσµατος ( και αντίστοιχα). Για µεγάλο οι δύο εκτιµήτριες συγκλίνουν στην ίδια τιµή. Αναπτύσσοντας τα τετράγωνα της (2.2) έχουµε τον ισοδύναµο τύπο (όµοια για την (2.3), δες επίσης την (.5) στην Παράγραφο.2.2) ( ) s 2 = x 2 i x2, (2.4) που συνήθως χρησιµοποιούµε στους υπολογισµούς. 2.. Κριτήρια καλών εκτιµητριών Παραπάνω ορίσαµε κάπως αυθαίρετα εκτιµήτριες της µέσης τιµής µ και της διασποράς σ 2 χωρίς να γνωρίζουµε αν είναι καλές εκτιµήτριες ή όχι. Γενικά όταν ορίζουµε µια εκτιµήτρια ˆθ κάποιας παραµέτρου θ ϑέλουµε να ελέγξουµε αν είναι κατάλληλη και γι αυτό ϑέτουµε κάποια κριτήρια ή ιδιότητες που πρέπει να πληρεί µια καλή εκτιµήτρια. Παρακάτω περιγράφονται ορισµένες επιθυµητές ιδιότητες µιας εκτιµήτριας ˆθ. Αµεροληψία Η ˆθ είναι αµερόληπτη (ubiased) αν η µέση τιµή της είναι ίση µε την παράµετρο θ, δηλαδή αν ισχύει E(ˆθ) = θ. Αλλιώς λέγεται µεροληπτική µε µεροληψία b(ˆθ) = E(ˆθ) θ. Παράδειγµα 2. Η δειγµατική µέση τιµή x είναι αµερόληπτη εκτιµήτρια της µέσης τιµής µ µιας τ.µ. X ενός πληθυσµού. Εχουµε θ = µ και ˆθ = x και ϑέλουµε να δείξουµε ότι E( x) = µ. Αυτό προκύπτει ως ( ) E( x) = E x i = E(x i ) = µ = µ.

2.. ΣΗΜΕΙΑΚ Η ΕΚΤ ΙΜΗΣΗ 25 Παράδειγµα 2.2 Για την εκτίµηση της διασποράς σ 2 µιας τ.µ. X ενός πληθυσµού µπορεί να δειχθεί ότι:. Η δειγµατική διασπορά s 2 είναι αµερόληπτη εκτιµήτρια της σ 2, δηλαδή ισχύει E(s 2 ) = σ 2. 2. Η δειγµατική διασπορά s 2 που ορίστηκε στη (2.3) είναι µεροληπτική εκτιµήτρια της σ 2 µε µεροληψία b( s 2 ) = σ2. Συνέπεια Η ιδιότητα αυτή ορίζει πως όσο αυξάνει το µέγεθος του δείγµατος τόσο µεγαλώνει η πιθανότητα η εκτίµηση να είναι κοντά στην πραγµατική τιµή της παραµέτρου, όπου το κοντά σηµαίνει ότι η διαφορά της εκτιµούµενης από την πραγµατική τιµή της παραµέτρου είναι µικρότερη από κάποια αυθαίρετα µικρή απόσταση ǫ. ηλαδή η ˆθ είναι συνεπής (cosistet) αν ισχύει P( θ ˆθ ǫ) όταν, όπου ǫ είναι αυθαίρετα µικρός ϑετικός αριθµός. Παράδειγµα 2.3 Η εκτιµήτρια x της µέσης τιµής µ µιας τ.µ. X είναι συνεπής. Αν όµως αντί της δειγµατικής µέσης τιµής διαλέξουµε σαν εκτιµήτρια της µ τον αριθµητικό µέσο της µικρότερης και µεγαλύτερης τιµής του δείγµατος x d = x mi + x max, 2 τότε µπορεί να δειχθεί ότι η εκτιµήτρια x d δεν είναι συνεπής εκτιµήτρια της µ. Αποτελεσµατικότητα Η αποτελεσµατικότητα αναφέρεται στη διασπορά της εκτιµήτριας και δίνεται συγκριτικά. Μια εκτιµήτρια ˆθ της θ είναι πιο αποτελεσµατική (effective) από µια άλλη εκτιµήτρια ˆθ 2 αν έχει µικρότερη διασπορά, σ 2ˆθ < σ 2ˆθ2. Παράδειγµα 2.4 Η δειγµατική µέση τιµή x και η x d είναι δύο εκτιµήτριες της µέσης τιµής µ κι έχουν διασπορές σ 2 x και σ2 x d αντίστοιχα. Μπορεί να δειχθεί ότι σ 2 x < σ 2 x d κι άρα η εκτιµήτρια x είναι πιό αποτελεσµατική από τη x d. Επάρκεια Μια εκτιµήτρια της παραµέτρου θ είναι επαρκής (adequate) όταν χρησιµοποιεί όλη την πληροφορία από το δείγµα που σχετίζεται µε τη θ. Παράδειγµα 2.5 Η δειγµατική µέση τιµή x, εκτιµήτρια της µέσης τιµής µ µιας τ.µ. X, είναι επαρκής γιατί χρησιµοποιεί όλες τις παρατηρήσεις που µετρήθηκαν στο δείγµα, ενώ η x d δεν είναι επαρκής γιατί χρησιµοποιεί µόνο δύο τιµές των παρατηρήσεων του δείγµατος (x mi και x max ). Παρατηρήσεις Από τα παραπάνω παραδείγµατα ϐλέπουµε πως οι εκτιµήτριες, x για την παραµέτρο µ και s 2 για την παράµετρο σ 2, που ορίσαµε αυθαίρετα, πληρούν όλες τις τέσσερις ιδιότητες και είναι καλές εκτιµήτριες.

26 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Στον ορισµό των εκτιµητριών x και s 2 δεν κάναµε κάποια υπόθεση για την κατανοµή της τ.µ. X κι άρα µπορούµε να τις χρησιµοποιήσουµε για οποιαδήποτε τ.µ. X που παρατηρούµε. Στη συνέχεια ϑα υποθέσουµε πως η κατανοµή της X είναι γνωστή (ως προς τη γενική µορφή της) αλλά δεν είναι γνωστή κάποια παράµετρο θ της κατανοµής και ϑα δούµε πως µπορούµε γενικά να υπολογίσουµε την εκτιµήτρια της θ. 2..2 Μέθοδος υπολογισµού της σηµειακής εκτίµησης Υποθέτουµε ότι η τ.µ. X έχει κάποια γνωστή κατανοµή, δηλαδή γνωρίζουµε τη γενική µορφή της αθροιστικής συνάρτησης κατανοµής F(x; θ) και της f(x; θ), που είναι η συνάρτηση πυκνότητας πιθανότητας αν η X είναι συνεχής και η συνάρτηση µάζας πιθανότητας αν η X είναι διακριτή. Η παράµετρος θ της κατανοµής είναι άγνωστη και ϑέλουµε να την εκτιµήσουµε από το δείγµα των παρατηρήσεων {x,...,x }. Θα ϑεωρήσουµε επίσης το πρόβληµα να έχουµε περισσότερες από µία άγνωστες παραµέτρους. Μέθοδος των Ροπών Για συνήθεις κατανοµές, µια παράµετρος θ της κατανοµής F(x; θ) σχετίζεται µε τις δύο κύριες παραµέτρους µ και σ 2. Για παράδειγµα, για την κανονική κατανοµή οι µ και σ 2 είναι οι µόνες δύο παράµετροι που καθορίζουν πλήρως της συνάρτηση της κατανοµής. Για την οµοιόµορφη κατανοµή σε διάστηµα [a, b], η σχέση των παραµέτρων της κατανοµής a και b µε τις µ και σ 2 δίνεται ως µ = a+b και σ 2 = (b a)2. 2 2 Γενικά όταν υπάρχει κάποια σχέση που µας επιτρέπει να υπολογίσουµε την παράµετρο θ (ή τις παραµέτρους θ, θ 2 ) από τις µ και σ 2, τότε ϐρίσκουµε την εκτιµήτρια ˆθ (ή τις εκτιµήτριες ˆθ, ˆθ 2 ) ως εξής:. υπολογίζουµε τις εκτιµήσεις x και s 2 των µ και σ 2 αντίστοιχα, 2. αντικαθιστούµε τις εκτιµήσεις x και s 2 στην έκφραση της θ (ή των θ, θ 2 ) ως προς µ και σ 2. Αυτή είναι η µέθοδος των ϱοπών (method of momets). Η ονοµασία προκύπτει από τη χρήση των ϱοπών στην εκτίµηση των παραµέτρων: τη µέση τιµή µ που είναι η πρώτη ϱοπή και τη διασπορά σ 2 που είναι η δεύτερη κεντρική ϱοπή. Αν οι δύο αυτές ϱοπές δεν επαρκούν, δηλαδή έχουµε να εκτιµήσουµε περισσότερες από δύο παραµέτρους ή οι σχέσεις δε δίνουν µοναδικότητα λύσης για τις παραµέτρους, χρησιµοποιούµε και ϱοπές µεγαλύτερου ϐαθµού, αλλά δε ϑα ασχοληθούµε µε τέτοια προβλήµατα. Παράδειγµα 2.6 Στο Κεφάλαιο µελετήσαµε ένα δείγµα από µετρήσεις της αντοχής ϑραύσης 25 σκυροδεµάτων κάποιου τύπου Α. Τα δεδοµένα αυτά (καθώς και τα δεδοµένα από 20 σκυροδέµατα ενός άλλου τύπου Β που ϑα µελετήσουµε αργότερα) δίνονται στον Πίνακα.3. Για την αντοχή ϑραύσης σκυροδέµατος τύπου Α είχαµε ϐρεί πως η δειγµατική µέση τιµή x είναι x = 25 25 x i = 4.8 = 5.67 25 και η δειγµατική διασπορά s 2 είναι (όπου έχουµε πρώτα υπολογίσει πως 25 x2 i = 83.3) s 2 = 24 ( 25 ) x 2 i 25 x2 = 24 (83.3 25 5.672 ) = 0.375.

2.. ΣΗΜΕΙΑΚ Η ΕΚΤ ΙΜΗΣΗ 27 Με ϐάση αυτό το δείγµα η εκτίµηση της µέση τιµής µ είναι 5.67 ksi και της διασποράς σ 2 είναι 0.375 (ksi) 2. Αν η τ.µ. X (αντοχή ϑραύσης σκυροδέµατος) ακολουθεί κανονική κατανοµή N(µ, σ 2 ), τότε είναι ϕανερό πως αυτές οι εκτιµήσεις περιγράφουν πλήρως την κανονική κατανοµή της X µε ϐάση αυτό το δείγµα. Αν η τ.µ. X ακολουθεί οµοιόµορφη κατανοµή σε κάποιο διάστηµα [a, b], τότε µπορούµε να εκτιµήσουµε τις παραµέτρους a και b από τις σχέσεις µ = a+b και σ 2 = (b a)2. Αντικαθιστούµε τις 2 2 µ και σ 2 µε τις εκτιµήσεις x και s 2 και λύνουµε το παρακάτω σύστηµα εξισώσεων x = a+b 2 s 2 = (b a)2 2 â = x 3s â = 4.6 ˆb = x + 3s ˆb = 6.73 Μέθοδος της Μεγίστης Πιθανοφάνειας Η µέθοδος αυτή δίνει την εκτίµηση που έχει τη µέγιστη πιθανοφάνεια, δηλαδή δίνει την τιµή της παραµέτρου η οποία, µεταξύ όλων των δυνατών τιµών της παραµέτρου, είναι η πιό πιθανή µε ϐάση το δείγµα. Η συνάρτηση πυκνότητας πιθανότητας για κάποια τιµή X = x i που εξαρτάται από κάποια παράµετρο θ παίρνει την τιµή f(x i ; θ) (αν η X είναι διακριτή τότε αυτή η τιµή εκφράζει την πιθανότητα P(X = x i ) ). Επειδή {x,...,x } είναι ανεξάρτητες, η πιθανότητα να τις παρατηρήσουµε σ ένα τυχαίο δείγµα µεγέθους δίνεται από τη συνάρτηση πιθανόφανειας (likelihood fuctio) ως προς θ L(x,..., x ; θ) = f(x ; θ) f(x ; θ). Στα προβλήµατα εκτίµησης, ϑεωρούµε τα {x,..., x } δεδοµένα και ενδιαφερόµαστε για τη θ. Άν λοιπόν L(x,...,x ; θ ) > L(x,...,x ; θ 2 ) για δύο τιµές θ και θ 2 της θ, τότε η τιµή θ είναι πιο αληθοφανής από τη θ 2 γιατί δίνει µεγαλύτερη πιθανότητα να παρατηρήσουµε τα {x,...,x }. Θέλουµε λοιπόν να ϐρούµε την πιό αληθοφανή τιµή της θ, δηλαδή την τιµή ˆθ που µεγιστοποιεί τη L(x,...,x ; θ) ή καλύτερα (για ευκολότερους υπολογισµούς) τη log L(x,...,x ; θ). Άρα η εκτιµήτρια µεγίστης πιθανοφάνειας (maximum likelihood estimator) ˆθ ϐρίσκεται από τη σχέση log L(x,...,x ; θ) θ = 0. (2.5) Άν ϑέλουµε να εκτιµήσουµε δύο ή περισσότερες παραµέτρους θ,..., θ m, η συνάρτηση πιθανόφανειας είναι L(x,...,x ; θ,...,θ m ) και οι εκτιµήτριες ˆθ,..., ˆθ m ϐρίσκονται λύνοντας το σύστηµα των m εξισώσεων log L(x,...,x ; θ,..., θ m ) θ j = 0 για j =,...,m. (2.6) Παράδειγµα 2.7 Εχουµε ένα τυχαίο δείγµα {x,...,x } από κανονική κατανοµή N(µ, σ 2 ) και ϑέλουµε να εκτιµήσουµε τη µέση τιµή µ ϑεωρώντας τη σ 2 γνωστή. Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανοµής είναι f X (x; µ) f(x) = 2πσ e (x µ)2 2σ 2.

28 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Η συνάρτηση πιθανόφανειας (για την οποία µόνο η παράµετρος µ είναι άγνωστη) είναι ( ) [ ] /2 L(x,...,x ; µ) = exp (x 2πσ 2 2σ 2 i µ) 2, όπου exp(x) e x. Ο λογάριθµος της συνάρτησης πιθανόφανειας είναι log L(x,...,x ; µ) = 2 log 2π 2 log(σ2 ) 2σ 2 (x i µ) 2. Η εκτιµήτρια µεγίστης πιθανοφάνειας ˆµ ϐρίσκεται µηδενίζοντας την παράγωγο της log L (σχέση (2.5) ) log L = 0 (x µ σ 2 i µ) = 0 (2.7) που δίνει τη λύση ˆµ = x i = x, δηλαδή είναι ίδια µε την εκτιµήτρια x της µέσης τιµής µ που ορίσαµε για οποιαδήποτε κατανοµή της τ.µ. X. Παράδειγµα 2.8 Ας υποθέσουµε στο προηγούµενο παράδειγµα πως κι η διασπορά σ 2 είναι άγνωστη. Τότε στην παραπάνω εξίσωση (2.7) προστίθεται κι η εξίσωση log L σ 2 = 0 2σ 2 + σ 4 (x i µ) 2 = 0. (2.8) Η επίλυση του συσήµατος των εξισώσεων (2.7) και (2.8) δίνει την ίδια λύση για τη µ και για τη σ 2 είναι σ 2 = (x i ˆµ) 2 = (x i x) 2. Οι εκτιµήτριες µεγίστης πιθανοφάνειας λοιπόν για τη µέση τιµή µ και τη διασπορά σ 2 µιας τ.µ. που ακολουθεί κανονική κατανοµή είναι απλά η δειγµατική µέση τιµή και διασπορά αντίστοιχα, αλλά για τη διασπορά έχουµε τη µεροληπτική δειγµατική διασπορά s 2 (σχέση (2.3) ). Ασυµπτωτικά όµως (για µεγάλο ) η εκτιµήτρια σ 2 = s 2 είναι αµερόληπτη. Η µέθοδος µεγίστης πιθανοφάνειας είναι η καλύτερη µέθοδος εκτίµησης αν γνωρίζουµε την κατανοµή της τ.µ. X και µπορεί να εφαρµοσθεί σε οποιοδήποτε πρόβληµα εκτίµησης παραµέτρων. Μέθοδος των Ελαχίστων Τετραγώνων Αυτή η µέθοδος εφαρµόζεται µόνο στην περίπτωση που οι άγνωστες παράµετροι εµφανίζονται σε σχέσεις τυχαίων µεταβλητών και οι σχέσεις αυτές είναι γραµµικές ως προς τις παραµέτρους που ϑέλουµε να εκτιµήσουµε. Μια απλή περίπτωση είναι να έχουµε µια τ.µ. Y και η κάθε τιµή της y να δίνεται από τη σχέση y = θ x + + θ m x m + ǫ,

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 29 όπου οι τιµές x,...,x m είναι γνωστές, θ,...,θ m είναι οι άγνωστες παράµετροι και ǫ είναι µια άλλη τ.µ. µε E(ǫ) = 0. Θα ασχοληθούµε µε τη µέθοδο αυτή στο Κεφάλαιο 4. Παρατηρήσεις Η µέθοδος µεγίστης πιθανοφάνειας µπορεί να εφαρµοσθεί για οποιοδήποτε θ αν γνωρί- Ϲουµε την κατανοµή F X (x; θ) ενώ η µέθοδος των ϱοπών δεν εφαρµόζεται αν η θ δε µπορεί να υπολογισθεί από τις ϱοπές. Η εκτίµηση µεγίστης πιθανοφάνειας έχει όλες τις ιδιότητες καλής εκτιµήτριας, δηλαδή είναι αµερόληπτη (ασυµπτωτικά, δηλαδή η µεροληψία b(θ) τείνει στο µηδέν για µεγάλα ), συνεπής, αποτελεσµατική κι επαρκής. Γι αυτό κι αυτή η µέθοδος είναι η καλύτερη µέθοδος εκτίµησης παραµέτρων αν γνωρίζουµε την κατανοµή F X (x; θ). 2.2 Εκτίµηση ιαστήµατος Εµπιστοσύνης Η σηµειακή εκτίµηση ˆθ από κάποιο δείγµα δεν περιέχει καµιά πληροφορία για την ακρίβεια της εκτίµησης της θ. Η εκτίµηση ˆθ είναι µια τιµή που δε γνωρίζουµε πόσο κοντά είναι στην πραγµατική τιµή της θ κι επίσης η τιµή αυτή αλλάζει µε το δείγµα. Για παράδειγµα, υπολογί- Ϲουµε τη δειγµατική µέση τιµή x από ένα τυχαίο δείγµα µεγέθους. Άν πάρουµε ένα άλλο τυχαίο δείγµα ίδιου µεγέθους, η τιµή της x ϑα είναι διαφορετική. Μπορεί να είναι πιό κοντά ή πιό µακριά στην πραγµατική τιµή της µ απ ότι αυτή από το προηγούµενο δείγµα. Γενικά λοιπόν η εκτιµήτρια ˆθ εξαρτάται από το δείγµα και είναι λοιπόν τ.µ. µε κάποια κατανοµή. Γι αυτό στην εκτίµηση της θ είναι σηµαντικό εκτός από τη σηµειακή εκτίµηση ˆθ να υπολογίσουµε και διάστηµα [θ, θ 2 ] που να µπορούµε να πούµε µε µεγάλη εµπιστοσύνη ότι ϑα περιέχει την πραγµατική τιµή της παραµέτρου θ. Στη συνέχεια ϑα δούµε τέτοια διαστήµατα εµπιστοσύνης για διάφορες παραµέτρους, αρχίζοντας από τη µέση τιµή. 2.2. ιάστηµα εµπιστοσύνης της µέσης τιµής µ Η σηµειακή εκτίµηση της µέσης τιµής µ µιας τ.µ. X είναι η δειγµατική µέση τιµή x (σχέση (2.)) που είναι κι αµερόληπτη εκτιµήτρια της µ, δηλαδή η µέση τιµή της x είναι η πραγµατική τιµή µ που είναι άγνωστη όµως σε µας, µ x = E( x) = µ. Παρ όλο που η εκτιµήτρια x είναι διαφορετική από δείγµα σε δείγµα, επειδή η x είναι συνεπής εκτιµήτρια, όταν αυξάνεται το µέγεθος του δείγµατος η x πλησιάζει τη µέση τιµή µ. Η διασπορά λοιπόν της x ϑα πρέπει να εξαρτάται από το έτσι ώστε καθώς ο αριθµός των παρατηρήσεων µεγαλώνει η διασπορά να µικραίνει. Πράγµατι για τη διασπορά σ2 x έχουµε σ 2 x = Var( x) = Var ( ) x i = Var(x 2 i ) = ) = σ2 2(σ2, (2.9) δηλαδή η διασπορά της εκτιµήτριας x είναι ανάλογη της διασποράς σ 2 της X κι αντιστρόφως ανάλογη του αριθµού των παρατηρήσεων. Στην παραπάνω σχέση υποθέσαµε πως οι παρατηρήσεις x,..., x είναι ανεξάρτητες (εννοώντας και πάλι τις τ.µ. X,...,X ). Την τυπική απόκλιση (τετραγωνική ϱίζα της διασποράς) σ x = σ/ της x ϑα την ονοµάζουµε σταθερό σφάλµα (stadard error) της εκτιµήτριας x.

30 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Η τ.µ. x λοιπόν έχει κάποια κατανοµή µε µέση τιµή µ x = µ και διασπορά σ 2 x = σ2 /. Στη συνέχεια, για να ορίσουµε διάστηµα εµπιστοσύνης της µ ϑα ϐασιστούµε στην κατανοµή της x. Για να υποθέσουµε κάποια γνωστή κατανοµή για τη x χρειάζεται να ελέγξουµε το µέγεθος του δείγµατος, αν η κατανοµή της X είναι κανονική κι αν γνωρίζουµε τη διασπορά της. Γνωστή διασπορά Θεωρούµε εδώ ότι γνωρίζουµε τη διασπορά σ 2 της τ.µ. X στον πληθυσµό. Για την κατανοµή της x διακρίνουµε δύο περιπτώσεις:. Αν η τ.µ. X ακολουθεί κανονική κατανοµή N(µ, σ 2 ) ή το δείγµα είναι µεγάλο ( > 30) τότε και η τ.µ. x ακολουθεί κανονική κατανοµή N(µ, σ 2 /). 2. Αν δε συµβαίνει το παραπάνω, δηλαδή αν η τ.µ. X δεν ακολουθεί κανονική κατανοµή και το δείγµα είναι µικρό τότε γενικά δε γνωρίζουµε την κατανοµή της x. Αν το δείγµα είναι µεγάλο η κανονική κατανοµή της x δίνεται από το Κεντρικό Οριακό Θεώρηµα, ενώ αν η τ.µ. X ακολουθεί κανονική κατανοµή τότε και το άθροισµα τέτοιων τ.µ. X,..., X ακολουθεί κανονική κατανοµή κι έτσι προκύπτει πως και η x ακολουθεί κανονική κατανοµή. Υποθέτοντας ότι η x ακολουθεί κανονική κατανοµή N(µ, σ 2 /), η τ.µ. z που προκύπτει από τον απλό µετασχηµατισµό z x µ σ/ ακολουθεί την τυπική κανονική κατανοµή x N(µ, σ 2 /) z x µ σ/ N(0, ). Για την τυπική κανονική κατανοµή µπορούµε εύκολα να ορίσουµε ένα διάστηµα [z α/2, z α/2 ], στο οποίο ϑα ανήκει η z µε κάποια δοθείσα πιθανότητα α, όπως ϕαίνεται στο Σχήµα 2.. Ο λόγος που χρησιµοποιούµε το δείκτη α/2 για την κρίσιµη τιµή z α/2 ϕαίνεται απο το Σχήµα 2.. Τα άκρα του διαστήµατος, z α/2 και z α/2, λέγονται κρίσιµες τιµές. Οι δείκτες α/2 και α/2 α α/2 α/2 z α/2 0 z α/2 Σχήµα 2.: Συνάρτηση πυκνότητας πιθανότητας της τυπικής κανονικής κατανοµής και οι ουρές της για κάποιο α. δηλώνουν τις τιµές της αθροιστικής συνάρτησης για z α/2 και z α/2 αντίστοιχα, δηλαδή ισχύει Φ(z α/2 ) = P(z < z α/2 ) = α/2 Φ(z α/2 ) = P(z < z α/2 ) = α/2 όπου Φ(z) είναι η αθροιστική συνάρτηση της τυπικής κανονικής κατανοµής. Άρα η πιθανότητα να είναι z < z α/2 ή z > z α/2 είναι α. Οι δύο σκιασµένες περιοχές στο Σχήµα 2. κατέχουν µαζί ποσοστό α% του συνολικού εµβαδού του ολοκληρώµατος της συνάρτησης πυκνότητας

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 3 πιθανότητας. Αντίστοιχα η πιθανότητα να συµβαίνει z [z α/2, z α/2 ] είναι α. Γενικά λοιπόν ισχύει P(z α/2 < z z α/2 ) = Φ(z α/2 ) Φ(z α/2 ) = α. Επειδή η συνάρτηση πυκνότητας πιθανότητας της τυπικής κανονικής κατανοµής είναι συµ- µετρική ως προς το 0 ισχύει z α/2 = z α/2. Άρα στην ουσία για να ορίσουµε το διάστηµα [z α/2, z α/2 ] χρειαζόµαστε µία µόνο κρίσιµη τιµή. Ανακεφαλαιώνοντας, ϐρήκαµε ότι σε κάθε δοθείσα πιθανότητα α αντιστοιχεί ένα διάστη- µα τιµών της τ.µ. z που ορίζεται από την κρίσιµη τιµή z α/2 που την υπολογίζουµε ως z α/2 = Φ ( α/2) από τον στατιστικό πίνακα της τυπικής κανονικής κατανοµής. Για παράδειγµα για α = 0.05 το διάστηµα [.96,.96] περιέχει την τ.µ. z µε πιθανότητα 0.95, όπου z 0.975 = Φ (0.975) =.96. [Ο συµβολισµός που χρησιµοποιούµε εδώ, όπως και για άλλες κατανοµές που ϑα δούµε παρακάτω, ϐασίζεται στην αρχή της αντιστοίχισης του δείκτη της κρίσιµης τιµής στην τιµή της αντίστοιχης αθροιστικής συνάρτησης. Σε κάποια ϐιβλία η ϑετική κρίσιµη τιµή z α/2 συµβολίζεται ως z α/2 και η αρνητική κρίσιµη τιµή z α/2 συµβολίζεται ως z α/2 ]. Θέλουµε να µετασχηµατίσουµε το διάστηµα [z α/2, z α/2 ] για πιθανότητα α στο αντίστοιχο διάστηµα που περιέχει την παραµέτρο µ. Γι αυτό λύνουµε τις σχέσεις z α/2 = x µ σ/ z α/2 = x µ σ/ ως προς µ και ϐρίσκουµε τα άκρα του διαστήµατος για τη µέση τιµή µ ] σ σ σ x ± z α/2 [ x z α/2, x + z α/2. (2.0) Το διάστηµα αυτό υπολογίστηκε για κάποια δοθείσα πιθανότητα α που είναι το προκα- ϑορισµένο επίπεδο εµπιστοσύνης (cofidece level) και λέγεται διάστηµα εµπιστοσύνης (cofidece iterval) της µ σε επίπεδο α. Η ερµηνεία αυτού του διαστήµατος ϑέλει προσοχή. Σε µια πρώτη προσέγγιση ϑα λέγαµε ότι σηµαίνει µε πιθανότητα (εµπιστοσύνη) α η µέση τιµή µ ϐρίσκεται µέσα σ αυτό το διάστηµα, το οποίο δεν είναι ορθό αφού η µ είναι σταθερό µέγεθος κι όχι τ.µ. για να µιλάµε για την τιµή της µε πιθανότητες. Το µέγεθος που αλλάζει (ανάλογα µε το δείγµα) είναι το διάστηµα και σ αυτό πρέπει να αναφέρεται η πιθανότητα ή εµπιστοσύνη. Σωστότερη λοιπόν ερµηνεία είναι ότι αν χρησιµοποιούσαµε πολλά τέτοια διαστήµατα από διαφορετικά δείγµατα, ποσοστό ( α)% απ αυτά ϑα περιείχαν τη µ ή µε α πιθανότητα (εµπιστοσύνη) το διάστηµα αυτό ϑα περιέχει την πραγµατική µ. Συνοπτικά η διαδικασία για τον προσδιορισµό του διαστήµατος εµπιστοσύνης της µ είναι Επιλογή του επιπέδου εµπιστοσύνης α Υπολογισµός του z α/2 από τον αντίστοιχο στατιστικό πίνακα για την τυπική κανονική κατανοµή Υπολογισµός του διαστήµατος [ x z α/2 σ, x + z α/2 σ ], όπου το σ είναι γνωστό και το x είναι η δειγµατική µέση τιµή των παρατηρήσεων.

32 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Παράδειγµα 2.9 Θέλουµε να εκτιµήσουµε διάστηµα εµπιστοσύνης σε επίπεδο 95% για τη µέση αντοχή ϑραύσης σκυροδέµατος τύπου Α από τα δεδοµένα του Πίνακα.3. Υποθέτουµε ότι από παλιότερες µετρήσεις γνωρίζουµε ότι η διασπορά για την αντοχή ϑραύσης σκυροδέµατος είναι σ 2 = 0.38 (ksi) 2. Εξετάζοντας τη δειγµατική κατανοµή αντοχής ϑραύσης από τα δεδοµένα µας, π.χ. σχεδιάζοντας το ιστόγραµµα των δεδοµένων του Πίνακα.3 (όπως κάναµε στο Σχήµα.2) ή το ϑηκόγραµµα που παρουσιάζεται στο Σχήµα 2.2, ϐλέπουµε ότι ϕαίνεται να είναι κανονική (είναι συµµετρική και δεν έχει µακριές ουρές). Ειδικά για το ϑηκόγραµµα ϕαίνεται να τηρούνται τα τρία χαρακτηριστικά που συνιστούν κανονική κατανοµή όπως τα ϑέσαµε στην Παράγραφο.2: Η διάµεσος δεν τείνει προς το Q ή το Q 3. Οι µύστακες έχουν περίπου το ίδιο µήκος. εν υπάρχουν ακραίες τιµές ή ύποπτες ακραίες τιµές. 7 Θηκoγραµµα αντoχης θραυσης για τυπo A 6.5 6 5.5 5 4.5 A Σχήµα 2.2: Θηκόγραµµα των δεδοµένων αντοχής ϑραύσης σκυροδέµατος τύπου Α του Πίνακα.3. Αρα µπορούµε να υποθέσουµε ότι η αντοχή ϑραύσης σκυροδέµατος X ακολουθεί κανονική κατανοµή N(µ, 0.38) και τότε η δειγµατική µέση τιµή x της αντοχής ϑραύσης σκυροδέµατος ακολουθεί επίσης κανονική κατανοµή N(µ, 0.38/25), όπου = 25 είναι το µέγεθος του δείγµατος. Για την εκτίµηση του διάστηµατος εµπιστοσύνης ακολουθούµε τα ϐήµατα:. Το επίπεδο εµπιστοσύνης είναι α = 0.95 (α = 0.05). 2. Από τον στατιστικό πίνακα έχουµε z 0.975 = Φ (0.975) =.96. 3. Το διάστηµα για τη µέση τιµή µ είναι (έχουµε υπολογίσει ότι x = 5.67 ksi, δες Παράδειγµα 2.6) 0.38 5.67 ±.96 [5.43, 5.9]. 5 Αρα το 95% διάστηµα εµπιστοσύνης της µέσης αντοχής ϑραύσης σκυροδέµατος µε ϐάση αυτό το δείγµα είναι [5.43, 5.9]. Μπορούµε να πούµε ότι η σηµειακή εκτίµηση x = 5.67 είναι αρκετά ακριβής αφού το αντίστοιχο 95% διάστηµα εµπιστοσύνης είναι αρκετά µικρό.

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 33 Άγνωστη διασπορά Γενικά η διασπορά σ 2 της τ.µ. X είναι άγνωστη και την εκτιµούµε από το δείγµα µε την s 2 (π.χ. δες την (2.4) που χρησιµοποιούµε για τους υπολογισµούς). Αν το δείγµα είναι µεγάλο ( > 30) η εκτιµήτρια s 2 είναι αρκετά ακριβής κι απλά µπορούµε να αντικαταστήσουµε τη διασπορά σ 2 µε τη δειγµατική διασπορά s 2 στην παραπάνω διαδικασία για να πάρουµε το διάστηµα εµπιστοσύνης για τη µ. Αν όµως το δείγµα είναι µικρό τότε η προσέγγιση δεν είναι καλή και το διάστηµα µπορεί να είναι αρκετά ανακριβές. Για µικρό και υποθέτοντας πως η X ακολουθεί κανονική κατανοµή, η τ.µ. t που ορίζεται ως t x µ s/ ακολουθεί την κατανοµή studet ή την t κατανοµή µε ϐαθµούς ελευθερίας t x µ s/ t. Η κατανοµή αυτή µοιάζει µε την τυπική κανονική κατανοµή και την προσεγγίζει καθώς αυξάνει ο αριθµός των ϐαθµών ελευθερίας όπως ϕαίνεται στο Σχήµα 2.3. Για µεγάλο η προσέγγιση 0.4 0.3 N(0,) t 5 t 24 t 50 f (x) X 0.2 0. 0 6 4 2 0 2 4 6 x Σχήµα 2.3: Συνάρτηση πυκνότητας πιθανότητας για την τυπική κανονική κατανοµή και την κατανοµή studet µε 5, 24 και 50 ϐαθµούς ελευθερίας, όπως δείχνει το επεξήγηµα των γραµ- µών. είναι πολύ καλή κι οι τιµές των t και z είναι πρακτικά ίδιες. Η διαδικασία για την εκτίµηση του διαστήµατος εµπιστοσύνης είναι ίδια όπως στην περίπτωση της γνωστής διασποράς, αλλά η άγνωστη διασπορά σ 2 αντικαθίσταται από τη δειγµατική διασπορά s 2 που υπολογίζεται από το δείγµα κι η κρίσιµη τιµή είναι t, α/2 αντί για z α/2 και τη ϐρίσκουµε από το στατιστικό πίνακα για την κατανοµή studet. [Η κρίσιµη τιµή της t ορίζεται από το α/2 αλλά και από τους ϐαθµούς ελευθερίας. Στο Σχήµα2.4 παρουσιάζεται η κατανοµή studet για = 24 ϐαθµούς ελευθερίας κι οι κρίσιµες τιµές της για α = 0.95.] Το διάστηµα εµπιστοσύνης σε επίπεδο α είναι x ± t, α/2 s. (2.) Παράδειγµα 2.0 Για το προηγούµενο παράδειγµα υποθέτουµε πως η διασπορά είναι άγνωστη (που είναι και η πιό πιθανή περίπτωση για το πραγµατικό πρόβληµα). Το δείγµα είναι αρκετά µεγάλο κι ίσως ϑα µπορούσαµε να υποθέσουµε πως η x σαν τ.µ. ακολουθεί κανονική κατανοµή

34 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ 0.4 0.3 f X (x) 0.2 0. t 24,0.025 = 2.064 t 24,0.975 =2.064 0 6 4 2 0 2 4 6 x Σχήµα 2.4: Συνάρτηση πυκνότητας πιθανότητας για την κατανοµή studet µε 24 ϐαθµούς ελευθερίας κι η δεξιά κι αριστερή κρίσιµη τιµή της για α = 0.95. και να χρησιµοποιήσουµε στους υπολογισµούς του διαστήµατος εµπιστοσύνης την κρίσιµη τιµή z α/2. Για να εκτιµήσουµε όµως το διάστηµα εµπιστοσύνης για τη µέση αντοχή ϑραύσης µε την καλύτερη δυνατή ακρίβεια χρησιµοποιούµε την κρίσιµη τιµή t, α/2 από την κατανοµή studet (δες Σχήµα 2.4). Η δειγµατική διασπορά έχει ϐρεθεί να είναι s 2 = 0.375 (ksi) 2 (δες Παράδειγµα 2.6). Από το στατιστικό πίνακα για την κατανοµή studet, για α/2 = 0.975 και = 24, ϐρίσκουµε t 24, 0.975 = 2.064 και το διάστηµα εµπιστοσύνης για τη µ είναι 5.67 ± 2.064 0.375 5 [5.42, 5.92]. Η χρήση της κρίσιµης τιµής t 24, 0.975 = 2.064 υπαγορεύεται από τη χρήση της εκτίµησης s 2 αντί της πραγµατικής διασποράς σ 2 που δεν τη γνωρίζουµε. Αν αποφασίζαµε εσφαλµένα να χρησιµοποιήσουµε στους παραπάνω υπολογισµούς τη z 0.975 =.96 της κανονικής κατανοµής ϑα ϐρίσκαµε το διάστηµα [5.52, 5.82] πού είναι ϕυσικά πιό µικρό αφού z 0.975 < t 24, 0.975. Το διάστηµα όµως αυτό δεν είναι ακριβές γιατί κάναµε την υπόθεση για κανονική κατανοµή της x που δεν εφαρµόζεται στην περίπτωση που η διασπορά είναι άγνωστη και το δείγµα είναι µικρό. Γενικά όταν τον δεν είναι µεγάλο το διάστηµα εµπιστοσύνης της x που παίρνουµε υποθέτοντας ότι η x ακολουθεί κατανοµή studet είναι πιό µεγάλο από αυτό που παίρνουµε υποθέτοντας ότι η x ακολουθεί κανονική κατανοµή και η διασπορά παραµένει η ίδια. Μη κανονική κατανοµή και µικρά δείγµατα Σε κάποιες περιπτώσεις το δείγµα µπορεί να είναι µικρό και η κατανοµή της τ.µ. X που παρατηρούµε να µην είναι κανονική. [ Οταν δε ξέρουµε τίποτε για την κατανοµή της X αυτό το εκτιµούµε από τα δεδοµένα του δείγµατος, π.χ. από τη µορφή του ιστογράµµατος ή του ϑηκογράµµατος των δεδοµένων.] Σε µια τέτοια περίπτωση (κι ανεξάρτητα από το αν η διασπορά είναι γνωστή ή όχι) δε µπορούµε να υποθέσουµε πως η x ακολουθεί κάποια συγκεκριµένη κατανοµή και στη συνέχεια να εκτιµήσουµε διάστηµα εµπιστοσύνης για τη µέση τιµή µ. Σε τέτοιες περιπτώσεις ενδιαφερόµαστε για τη διάµεσο δ = δ X της τ.µ. X αντί της µ = µ X. Η σηµειακή εκτίµηση x της δ είναι απλά η κεντρική τιµή των παρατηρήσεων διαταγµένες

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 35 σε αύξουσα σειρά (δες Παράγραφο.2.). Το διάστηµα εµπιστοσύνης για τη δ ϐρίσκεται µε τη µέθοδο Wilcoxo που ϐασίζεται στην τάξη των παρατηρήσεων παρά στις τιµές τους. Αυτή η εκτίµηση διαστήµατος εµπιστοσύνης λέγεται µη παραµετρική (επειδή δεν υποθέτουµε κάποια κατανοµή και τις παραµέτρους της για την εκτιµήτρια). Παρατηρήσεις Γενικά ϑα ϑέλαµε το διάστηµα εµπιστοσύνης να είναι όσο το δυνατό µικρότερο για να έχουµε όσο το δυνατόν πιό ακριβή σηµειακή εκτίµηση. Το διάστηµα εµπιστοσύνης εξαρτάται από: την κατανοµή και τη διασπορά σ 2 της τ.µ. X [αυτά δε µπορούµε να τα αλλάξουµε, είναι χαρακτηριστικά της τ.µ. που µελετάµε]. το µέγεθος του δείγµατος [αύξηση του έχει σαν αποτέλεσµα τη µείωση του εύρους του διαστήµατος, που είναι ϕυσικά επιθυµητό αλλά όχι πάντοτε εφικτό, αφού η απόκτηση πολλών παρατηρήσεων µπορεί να είναι εργασία επίπονη και πολυέξοδη]. το επίπεδο εµπιστοσύνης α [αυτό το καθορίζουµε εµείς, αλλά δε ϑα ϑέλαµε να µικρήνουµε το διάστηµα µειώνοντας την εµπιστοσύνη µας σ αυτό γιατί τότε τα αποτελέσµατά µας δε ϑα έχουν την επιθυµητή στατιστική σηµαντικότητα]. Το επίπεδο εµπιστοσύνης που συνήθως χρησιµοποιείται στην πράξη είναι 95%. Στον Πίνακα 2. συνοψίζεται η εκτίµηση του διαστήµατος εµπιστοσύνης της µ στις διάφορες περιπτώσεις. διασπορά κατανοµή της X κατανοµή της x διάστηµα εµπιστοσύνης γνωστή κανονική z x µ σ/ N(0, ) x ± z σ α/2 γνωστή µη κανονική µεγάλο z x µ σ/ N(0, ) x ± z σ α/2 γνωστή µη κανονική µικρό άγνωστη µεγάλο z x µ s/ N(0, ) x ± z s α/2 άγνωστη κανονική µικρό t x µ s/ t x ± t s, α/2 άγνωστη µη κανονική µικρό Πίνακας 2.: Εκτίµηση του διαστήµατος εµπιστοσύνης της µ ανάλογα µε τη γνώση της διασποράς και κατανοµής της τ.µ. X και το µέγεθος του δείγµατος. Εύρος διαστήµατος εµπιστοσύνης Πολλές ϕορές πριν να κάνουµε το πείραµα και συλλέξουµε τις µετρήσεις προκαθορίζουµε ένα συγκεκριµένο εύρος για το δ.ε. ή Ϲητάµε το εύρος του δ.ε. να µην ξεπερνάει κάποιο ανώτατο όριο για να έχουν νόηµα τα αποτελέσµατα. Για να το πετύχουµε αυτό χωρίς να αλλάξουµε τη σηµαντικότητα των στατιστικών αποτελεσµάτων, ϐρίσκουµε το µέγεθος του δείγµατος που µας δίνει αυτό το εύρος του δ.ε. Αυτό υπολογίζεται ϑέτοντας το εύρος του δ.ε. ίσο µε την τιµή που Ϲητάµε και λύνοντας την εξίσωση ως προς

36 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ το. Για παράδειγµα, ας υποθέσουµε πως το δείγµα είναι µικρό και η τ.µ. X ακολουθεί κανονική κατανοµή µε άγνωστη διασπορά, χρησιµοποιούµε δηλαδή τη σχέση (2.) για να υπολογίσουµε το δ.ε. της µέσης τιµής µ. Το εύρος του δ.ε. είναι w = 2 t, α/2 s (2.2) και λύνοντας ως προς ϐρίσκουµε ότι για να είναι το εύρος του δ.ε. ίσο µε w πρέπει το δείγµα να έχει µέγεθος ( = 2 t, α/2 s ) 2. (2.3) w Στην παραπάνω σχέση η τιµή t, α/2 δεν είναι γνωστή αφού το είναι άγνωστο και Ϲητούµενο. Θα πρέπει λοιπόν να χρησιµοποιήσουµε την τιµή t, α/2 που συµφωνεί καλύτερα µε το αποτέλεσµα για το από την (2.3). Αν το παίρνει µεγάλες τιµές το παραπάνω πρόβληµα δεν υφίσταται αφού για µεγάλα η κρίσιµη τιµή t, α/2 είναι πρακτικά ίδια µε την αντίστοιχη κρίσιµη τιµή της τυπικής κανονικής κατανοµής z α/2. Άρα για µεγάλο η σχέση (2.3) δίνεται ως ( = 2 z α/2 s ) 2. (2.4) w Παράδειγµα 2. Στο προηγούµενο παράδειγµα για την αντοχή ϑραύσης σκυροδέµατος υπολογίσαµε το 95% δ.ε. της µέσης αντοχής ϑραύσης κάνοντας χρήση της κατανοµής studet και ϐρήκαµε ότι είναι [5.42, 5.92] ksi. Το εύρος του δ.ε. είναι w = 5.92 5.42 = 0.50 ksi. Αν ϑέλουµε να το µειώσουµε στο µισό (δηλαδή σε w = 0.25 ksi) τότε αντί για 25 δοκίµια πρέπει να χρησιµοποιήσουµε ( ) 2 0.375 = 2.96 = 92.2 93, 0.25 δηλαδή πρέπει να αυξήσουµε το δείγµα σε 93 δοκίµια. 2.2.2 ιάστηµα εµπιστοσύνης της διασποράς σ 2 Οπως για να ϐρούµε διάστηµα εµπιστοσύνης για τη µέση τιµή µ ορίσαµε πρώτα την κατανοµή της εκτιµήτριας x έτσι και για να ϐρούµε διάστηµα εµπιστοσύνης για τη διασπορά σ 2 ορίζουµε πρώτα την κατανοµή της αµερόληπτης εκτιµήτριας s 2 της σ 2 (π.χ. από τη σχέση (2.4)). Γνωρίζουµε ότι η χ 2 ( )s2 ακολουθεί την κατανοµή X 2 µε ϐαθµούς ελευθερίας σ 2 χ 2 ( )s2 σ 2 X 2. Στο Σχήµα 2.5 παρουσιάζεται η µορφή της κατανοµής X 2 για χαρακτηριστικούς ϐαθµούς ελευ- ϑερίας. Για λίγους ϐαθµούς ελευθερίας η κατανοµή X 2 είναι αρκετά λοξή και γίνεται πιο συµµετρική καθώς αυξάνουν οι ϐαθµοί ελευθερίας. Για δοθείσα πιθανότητα α µπορούµε να ϐρούµε από τον στατιστικό πίνακα για τη κατανοµή X 2 τις δύο κρίσιµες τιµές χ 2,α/2 και χ2, α/2 για τις οποίες ισχύει P(χ 2,α/2 < χ 2 < χ 2, α/2) = α. (2.5)

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 37 0.8 0.6 0.4 X 2 5 0.2 0. f (x) X 0.08 0.06 0.04 0.02 X 2 24 X 2 50 0 0 20 40 60 80 x Σχήµα 2.5: Συνάρτηση πυκνότητας πιθανότητας για την κατανοµή X 2 µε 5, 24 και 50 ϐαθµούς ελευθερίας. Επειδή η X 2 δεν είναι συµµετρική έχουµε δύο κρίσιµες τιµές: την αριστερή κρίσιµη τιµή χ 2,α/2 που είναι τέτοια ώστε P(χ2 < χ 2,α/2 ) = α/2 και τη δεξιά κρίσιµη τιµή χ2, α/2 που είναι τέτοια ώστε P(χ 2 < χ 2, α/2 ) = α/2. [Οι δείκτες α/2 και α/2 των κρίσιµων τιµών είναι κι οι τιµές της αντίστοιχης αθροιστικής συνάρτησης κατανοµής.] Στο Σχήµα 2.6 παρουσιάζεται η κατανοµή X 2 για = 24 ϐαθµούς ελευθερίας καθώς κι οι κρίσιµες τιµές της για α = 0.95. 0.06 0.05 X 2 24 0.04 f X (x) 0.03 0.02 0.0 X 2 24,0.025 = 2.4 X 2 24,0.975 =39.4 0 0 0 20 30 40 50 60 x Σχήµα 2.6: Συνάρτηση πυκνότητας πιθανότητας για την κατανοµή X 2 µε 24 ϐαθµούς ελευ- ϑερίας κι η δεξιά κι αριστερή κρίσιµη τιµή της για α = 0.95. Στη σχέση (2.5), λύνοντας τις δύο ανισότητες χ 2,α/2 < ( )s2 σ 2 χ 2, α/2 ως προς σ 2 ϐρίσκουµε το ( α)% διάστηµα εµπιστοσύνης για τη σ 2 [ ] ( )s 2 ( )s2,, χ 2, α/2 χ 2 (2.6),α/2

38 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ όπου η δειγµατική διασπορά s 2 υπολογίζεται από το δείγµα των παρατηρήσεων. Το 95% δ.ε. για την τυπική απόκλιση σ έχει σαν άκρα τις τετραγωνικές ϱίζες των αντίστοιχων άκρων του 95% δ.ε. για τη διασπορά σ 2. Παράδειγµα 2.2 Από τα δεδοµένα για την αντοχή ϑραύσης σκυροδέµατος τύπου Α του Πίνακα.3 ϑέλουµε να εκτιµήσουµε τη διασπορά σ 2 της αντοχής ϑραύσης σκυροδέµατος τύπου Α. Η σηµειακή εκτίµηση ϐρέθηκε να είναι s 2 = 0.375 (ksi) 2. Για = 24 και α = 0.05 από τον στατιστικό πίνακα για τη X 2 ϐρίσκουµε χ 2 24, 0.025 = 2.4 και χ2 24, 0.975 = 39.4 (δες Σχήµα 2.6). Το 95% διάστηµα εµπιστοσύνης για τη σ 2 είναι [ 24 0.375, 39.4 24 0.375 2.4 ] = [0.228, 0.726]. Το 95% δ.ε. για την τυπική απόκλιση σ της αντοχής ϑραύσης σκυροδέµατος είναι [ 0.228, 0.726] = [0.478, 0.852]. Στο παραπάνω παράδειγµα παρατηρούµε ότι η εκτίµηση s 2 = 0.375 (ksi) 2 είναι πιό κοντά στο αριστερό άκρο του διαστήµατος εµπιστοσύνης. Γενικά το διάστηµα εµπιστοσύνης για τη διασπορά σ 2 δεν είναι συµµετρικό ως προς τη σηµειακή εκτίµηση s 2 κι αυτό γιατί η κατανοµή X 2 δεν είναι συµµετρική όπως είναι η κανονική κατανοµή κι η κατανοµή studet. Οσο µεγαλώνουν όµως οι ϐαθµοί ελευθερίας (δηλαδή το µέγεθος δείγµατος) η X 2 κατανοµή προσεγγίζει την κανονική κατανοµή (δες Σχήµα 2.5). Γι αυτό για πολύ µεγάλα δείγµατα το διάστηµα εµπιστοσύνης µπορεί να υπολογισθεί κι από άλλο τύπο που περιέχει κρίσιµες τιµές της τυπικής κανονικής κατανοµής. 2.2.3 ιάστηµα εµπιστοσύνης της αναλογίας p Σε αρκετά προβλήµατα τα δεδοµένα δεν είναι αριθµητικές τιµές µιας τ.µ. του πληθυσµού αλλά δυαδικές τιµές, δηλαδή κάποιο στοιχείο του πληθυσµού έχει µια ιδιότητα (επιτυχία ή ) ή δεν την έχει (αποτυχία ή 0). Ο λόγος των στοιχείων του πληθυσµού που πληρούν την ιδιότητα προς το σύνολο όλων των στοιχείων του πληθυσµού λέγεται αναλογία p. [Η αναλογία p είναι η πιθανότητα επιτυχίας σε µια δοκιµή όταν αναφερόµαστε σε ακολουθίες Beroulli.] Ενα παράδειγµα είναι η αναλογία κοριτσιών στις Πολυτεχνικές Σχολές της Ελλάδας ή η αναλογία σκουριασµένων ϱάβδων χάλυβα σε µια αποθήκη. Σε πολλές περιπτώσεις ϑέλουµε να εκτιµήσουµε την αναλογία p από ένα δείγµα µεγέθους. Η σηµειακή εκτίµηση της p είναι απλά ˆp = m, ο λόγος των επιτυχίων m στο δείγµα προς το πλήθος των στοιχείων του δείγµατος. Γνωρίζουµε ότι για µεγάλο η κατανοµή της εκτιµήτριας ˆp είναι κανονική µε µέση τιµή E(ˆp) = p και διασπορά Var(ˆp) = p( p), δηλαδή ισχύει ˆp N(p, p( p) ). Ακολουθώντας την ίδια διαδικασία όπως για τη µέση τιµή µε γνωστή διασπορά, µε τη ϐοήθεια του µετασχηµατισµού ˆp p z p( p)/

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 39 καταλήγουµε στο διάστηµα εµπιστοσύνης για την αναλογία p p( p) ˆp ± z α/2. Αντικαθιστώντας στο τυπικό σφάλµα την αναλογία p µε την δειγµατική αναλογία ˆp έχουµε το διάστηµα εµπιστοσύνης για την p από το δείγµα ˆp( ˆp) ˆp ± z α/2. (2.7) Το εύρος του δ.ε. της αναλογίας p είναι ˆp( ˆp) w = 2 z α/2. (2.8) Λύνοντας την παραπάνω σχέση ως προς ϐρίσκουµε ( ) 2 2 z α/2 = ˆp( ˆp). w Πριν από τη µελέτη του δείγµατος δε γνωρίζουµε την εκτίµηση της αναλογίας p. Άρα από την παραπάνω σχέση δε µπορούµε να ϐρούµε τον αριθµό των παρατηρήσεων που ϑα χρειαστούµε για να υπολογίσουµε δ.ε. της p εύρους w. Μπορεί να δειχθεί όµως πως η µέγιστη τιµή που µπορεί να πάρει η έκφραση ˆp( ˆp) είναι 0.25. Άρα το µέγεθος δείγµατος που χρειαζόµαστε για να εξασφαλίσουµε µέγιστο εύρος w του δ.ε. είναι ( ) 2 2z α/2 ( z α/2 ) 2 = 0.25 =. (2.9) w w Παράδειγµα 2.3 Για να εκτιµήσουµε την αναλογία σκουριασµένων ϱαβδών χάλυβα µιας απο- ϑήκης πήραµε ένα δείγµα από = 00 ϱάβδους και ϐρήκαµε m = 2 σκουριασµένες. Η σηµειακή εκτίµηση για την αναλογία p των σκουριασµένων ϱαβδών είναι ˆp = 2 = 00 0.2. Το 95% διάστηµα εµπιστοσύνης είναι (z α/2 = z 0.975 =.96) 0.2 ( 0.2) 0.2 ±.96 [0.056, 0.84]. 00 Αρα σε 95% επίπεδο εµπιστοσύνης και µε ϐάση το δείγµα µας µπορούµε να πούµε ότι το διάστηµα [0.056, 0.84] ϑα περιέχει την πραγµατική αναλογία σκουριασµένων ϱαβδών χάλυβα, την οποία ϑα µπορούσαµε να τη ϐρούµε αν καταµετρούσαµε όλες τις ϱάβδους στην αποθήκη. Εστω ότι ϑέλουµε να εκτιµήσουµε το διάστηµα εµπιστοσύνης της αναλογίας p των σκουριασµένων ϱαβδών στο ίδιο επίπεδο εµπιστοσύνης 95% αλλά µε µικρότερο εύρος w = 0.05 (ή αν αναφερόµαστε σε ποσοστά το εύρος να είναι 5 εκατοστιαίες µονάδες). Από την σχέση (2.9) ϐρίσκουµε ότι το µέγιστο µέγεθος του δείγµατος που ϑα χρειαστούµε είναι (αντικαθιστώντας τις τιµές z α/2 = z 0.975 =.96 και w = 0.05) ( ) 2.96 = = 536.6 537, 0.05 δηλαδή για να µειώσουµε το εύρος του 95% διαστήµατος εµπιστοσύνης της αναλογίας σκουριασµένων ϱαβδών περίπου στο /3 πρέπει να αυξήσουµε το µέγεθος του δείγµατος πάνω από 5 ϕορές.

40 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ 2.2.4 ιάστηµα εµπιστοσύνης της διαφοράς δύο µέσων τιµών µ µ 2 Θέλουµε να εκτιµήσουµε τη διαφορά των µέσων τιµών µ και µ 2 δύο ανεξάρτητων τ.µ. X και X 2 έχοντας δύο δείγµατα µεγέθους και 2 από τον πληθυσµό της X και τον πληθυσµό της X 2 αντίστοιχα. Η σηµειακή εκτίµηση της διαφοράς µ µ 2 είναι απλά η διαφορά των δειγµατικών µέσων τιµών x x 2. Για το διάστηµα εµπιστοσύνης της διαφοράς µ µ 2 πρέπει να ελέγξουµε την κατανοµή της εκτιµήτριας x x 2, όπως κάναµε στην εκτίµηση διαστήµατος εµπιστοσύνης για τη µέση τιµή µ. Γνωστές διασπορές Θεωρούµε ότι γνωρίζουµε τις διασπορές σ 2 και σ2 2 των X και X 2. Υπο- ϑέτουµε επίσης ότι το δείγµα είναι αρκετά µεγάλο ή η κατανοµή των X και X 2 είναι κανονική. Τότε η εκτιµήτρια x x 2 ακολουθεί κανονική κατανοµή µε µέση τιµή µ µ 2 και διασπορά σ 2 + σ2 2 2. Αν οι X και X 2 είναι οµοσκεδαστικές, δηλαδή σ 2 = σ2 2 = σ2, τότε η διασπορά είναι σ 2 ( + 2 ). Η διαδικασία είναι ίδια όπως για την εύρεση του διαστήµατος εµπιστοσύνης για τη µέση τιµή µ αν κάνουµε τις παρακάτω αντικαταστάσεις: εκτιµήτρια x x x 2 µέση τιµή εκτιµήτριας µ µ µ 2 σ 2 διασπορά εκτιµήτριας σ2 + σ2 2. 2 Εποµένως το διάστηµα εµπιστοσύνης της διαφοράς µ µ 2 είναι σ 2 ( x x 2 ) ± z α/2 + σ2 2. (2.20) 2 Στην πράξη, όταν εκτιµάµε το διάστηµα εµπιστοσύνης της διαφοράς µ µ 2 είναι γιατί ϑέλουµε να διαπιστώσουµε αν κατά µέσο όρο η µια τ.µ. είναι διαφορετική (µεγαλύτερη ή µικρότερη) από την άλλη και αν ναι να εκτιµήσουµε το µέγεθος αυτής της διαφοράς. Το διάστηµα εµπιστοσύνης λοιπόν το ερµηνεύουµε ως εξής: Αν περιέχει το µηδέν τότε δε µπορούµε να πούµε ότι οι µέσες τιµές των τ.µ. X και X 2 διαφέρουν για το επίπεδο εµπιστοσύνης που χρησιµοποιήσαµε και µε ϐάση τα συγκεκριµένα δεδοµένα. Αν είναι ϑετικό τότε µπορούµε να πούµε πως για το επίπεδο εµπιστοσύνης που χρησι- µοποιήσαµε η τ.µ. X είναι κατά µέσο όρο µεγαλύτερη από τη X 2 κατά ένα ποσό που κυµαίνεται στα όρια του διαστήµατος που εκτιµήσαµε. Ανάλογα ερµηνεύουµε το διάστη- µα εµπιστοσύνης όταν είναι αρνητικό. Παράδειγµα 2.4 Ενδιαφερόµαστε να διαπιστώσουµε αν η αντοχή ϑραύσης σκυροδέµατος ενός τύπου Α είναι κατά µέσο όρο διαφορετική από αυτή ενός άλλου τύπου Β. Γι αυτό ϑέλουµε να εκτιµήσουµε το 95% διάστηµα εµπιστοσύνης για τη διαφορά των µέσων τιµών µ και µ 2 της αντοχής ϑραύσης σκυροδέµατος του τύπου Α και Β αντίστοιχα. ίνεται ότι η διασπορά είναι κοινή και γνωστή και είναι σ 2 = 0.38 (ksi) 2.

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 4 Στον Πίνακα.3 έχουµε 25 µετρήσεις αντοχής ϑραύσης σκυροδέµατος από τον τύπο Α και 20 από τον τύπο Β. Στο Παράδειγµα 2.9 είδαµε µε τη ϐοήθεια ιστογράµµατος (Σχήµα.2) και ϑηκογράµµατος (Σχήµα 2.2) πως η αντοχή ϑραύσης του σκυροδέµατος τύπου Α ϑα µπορούσε να ακολουθεί κανονική κατανοµή. Από το ιστόγραµµα και το ϑηκόγραµµα του Σχήµατος 2.7 µπορούµε να πούµε το ίδιο και για τον τύπο Β. Αρα µπορούµε να υποθέσουµε πως οι τ.µ. αντοχής 5 Histogram of beto data of type B 7 Θηκoγραµµα αντoχης θραυσης για τoυς 2 τυπoυς 4 6.5 3 6 5.5 2 5 4.5 0 4 4.5 5 5.5 6 6.5 7 bis A B Σχήµα 2.7: Ιστόγραµµα των δεδοµένων αντοχής ϑραύσης σκυροδέµατος του τύπου Β του Πίνακα.3 και ϑηκογράµµατα των δεδοµένων αντοχής ϑραύσης σκυροδέµατος των δύο τύπων. ϑραύσης X και X 2 και για τους δύο πληθυσµοούς, δηλαδή τους δύο τύπους σκυροδέµατος, ακολουθούν κανονική κατανοµή. Συγκρίνοντας τα ϑηκογράµµατα για τον τύπο Α και Β (δες Σχήµα 2.2) ϕαίνεται ότι η κεντρική τάση (εδώ διάµεσος) της αντοχής ϑραύσης σκυροδέµατος τύπου Β να είναι χαµηλότερη από αυτή του τύπου Α, αλλά ίσως όχι σηµαντικά αφού οι δύο ϑήκες (τα διαστήµατα των 50% κεντρικών τιµών του κάθε δείγµατος) επικαλύπτονται κατά µεγάλο ποσοστό. Στη συνέχεια ϑα υπολογίσουµε αν αυτή η διαφορά είναι στατιστικά σηµαντική κάνοντας χρήση του διαστήµατος εµπιστοσύνης της µ µ 2. Οι δειγµατικές µέσες τιµές υπολογίζονται σε x = 5.67 ksi και x 2 = 5.38 ksi. Η διαφορά τους είναι x x 2 = 0.29 ksi. Από τη σχέση (2.20), όπου z α/2 = z 0.975 =.96 και σ 2 = σ2 2 = σ2 = 0.38 ϐρίσκουµε ότι το 95% διάστηµα εµπιστοσύνης είναι 0.29 ±.96 0.38 ( 25 + ) 20 [ 0.073, 0.653]. Συµπεραίνουµε λοιπόν πως σε επίπεδο εµπιστοσύνης 95% δε µπορούµε να πούµε πως οι δύο τύποι σκυροδέµατος διαφέρουν σηµαντικά ως προς τη µέση αντοχή ϑραύσης. Το διάστηµα [ 0.073, 0.653] είναι σχεδόν ϑετικό αλλά δε µας επιτρέπει να συµπεράνουµε στατιστικά σηµαντική διαφορά. Για τέτοια οριακά αποτελέσµατα η µόνη λύση είναι να αυξήσουµε τα δείγµατα και να κάνουµε πάλι την εκτίµηση. Άγνωστες διασπορές Συνήθως όταν δε γνωρίζουµε τις µ, µ 2 αγνοούµε και τις σ 2, σ2 2. Οταν το δείγµα είναι µεγάλο ( > 30) µπορούµε να αντικαταστήσουµε στη σχέση (2.20) τις σ 2, σ2 2 µε τις δειγµατικές διασπορές s 2, s2 2 και να εκτιµήσουµε έτσι το διάστηµα εµπιστοσύνης για τη διαφορά µ µ 2.

42 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Οταν όµως το µέγεθος του ενός ή και των δύο δειγµάτων είναι µικρό η εκτίµηση του διαστήµατος εµπιστοσύνης είναι πιο περίπλοκη. Στην περίπτωση που οι κατανοµές των X και X 2 δε δίνονται (ή ϕαίνονται από τα δεδοµένα) να είναι κανονικές, δε µπορούµε γενικά να προσδιορίσουµε την κατανοµή της διαφοράς x x 2 για να εκτιµήσουµε έτσι το διάστηµα εµπιστοσύνης. Σε µια τέτοια περίπτωση πρέπει να καταφύγουµε σε µή-παραµετρική εκτίµηση. Στη συνέχεια υποθέτουµε πως οι κατανοµές των X και X 2 είναι κανονικές κι επιπλέον οµοσκεδαστικές (σ 2 = σ2 2 = σ2 ). Σ αυτήν την περίπτωση ορίζουµε πρώτα τη δειγµατική κοινή διασπορά s 2 ως συνάρτηση των s 2 και s2 2 s 2 = ( )s 2 + ( 2 )s 2 2. (2.2) + 2 2 Μπορεί να δειχθεί ότι η s 2 είναι αµερόληπτη εκτιµήτρια της κοινής διασποράς ( σ 2. Με τη ϐοήθεια της s 2 η εκτίµηση της διασποράς της διαφοράς x x 2 είναι s 2 + 2 ). Για την εκτιµήτρια x x 2 µπορούµε να ορίσουµε τον παρακάτω µετασχηµατισµό που ακολουθεί κατανοµή studet µε + 2 2 ϐαθµούς ελευθερίας t ( x x 2 ) (µ µ 2 ) t + 2 2 s + 2 από το οποίο προκύπτει πως το ( α)% διάστηµα εµπιστοσύνης της διαφοράς µ µ 2 είναι ( x x 2 ) ± t + 2 2, α/2 s +. (2.22) 2 Παράδειγµα 2.5 Για το προηγούµενο παράδειγµα ας υποθέσουµε πως η διασπορά αντοχής ϑραύσης για τους δύο τύπους σκυροδέµατος είναι άγνωστη. Από τα δύο ιστογράµµατα στα Σχή- µατα.2 και 2.7 καθώς και τα ϑηκογράµµατα στο Σχήµα 2.7 µπορούµε να δεχτούµε οτι οι τ.µ. αντοχής ϑραύσης και για τους δύο τύπους ακολουθούν κανονική κατανοµή και µάλιστα έχουν την ίδια διασπορά (το εύρος των τιµών των δύο δειγµάτων είναι περίπου το ίδιο). [Τα ϑηκογράµµατα δείχνουν κάποια διαφορά στη διασπορά των τιµών µεταξύ των δύο τύπων αλλά για να αποκλίσουµε ότι οι διασπορές µπορεί να είναι ίσες ϑα πρέπει η µια ϑήκη να είναι τουλάχιστον διπλάσια της άλλης.] εχό- µαστε λοιπόν ότι η κατανοµή της αντοχής ϑραύσης και για τα δύο σκυροδέµατα είναι κανονική, οι διασπορές είναι ίδιες κι επειδή επιπλέον τα δείγµατα είναι σχετικά µικρά συµπεραίνουµε ότι η διαφορά x x 2 ακολουθεί κατανοµή studet. Η δειγµατική διασπορά για τον τύπο Α είναι s 2 = 0.375 (ksi) 2 και για τον τύπο Β είναι s 2 2 = 0.326 (ksi)2 (σχετικά κοντά). Εφαρµόζοντας τη σχέση (2.2) ϐρίσκουµε ότι η δειγµατική κοινή διασπορά είναι s 2 = 0.353 (ksi) 2 κι εποµένως s = 0.594 ksi (όπου = 25 και 2 = 20). Οι ϐαθµοί ελευθερίας είναι + 2 2 = 43 και για επίπεδο εµπιστοσύνης 95% ϐρίσκουµε από τον στατιστικό πίνακα για την κατανοµή studet την κρίσιµη τιµή t 43, 0.975 = 2.02 (πολύ κοντά στην αντίστοιχη κρίσιµη τιµή z 0.975 =.96 της τυπικής κανονικής κατανοµής γιατί οι ϐαθµοί ελευθερίας είναι πολλοί). Το 95% διάστηµα εµπιστοσύνης είναι ( x x 2 = 0.29) 0.29 ± 2.02 0.594 25 + [ 0.07, 0.65]. 20 Οπως και πριν που η διασπορά ήταν γνωστή δε µπορούµε να πούµε πως οι µέσες τιµές αντοχής ϑραύσης των δύο τύπων σκυροδέµατος διαφέρουν µε στατιστική σηµαντικότητα.

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 43 Παρατηρήσεις Οι παράγοντες που επηρεάζουν τον υπολογισµό του διαστήµατος εµπιστοσύνης της µ µ 2 είναι οι ίδιες όπως για τη µ. Σ αυτές προστίθεται και ο παράγοντας της ισότητας των διασπορών των X και X 2. Στον Πίνακα2.2 συνοψίζεται η εκτίµηση του διαστήµατος εµπιστοσύνης της µ µ 2 στις διάφορες περιπτώσεις. Υπάρχει ϕανερή αντιστοιχία των περιπτώσεων για διασπορές κατανοµή, 2 κατανοµή της x x 2 διάστηµα εµπιστοσύνης των X,X 2 των X,X 2 γνωστές κανονική z ( x x 2 ) (µ µ 2 ) σ N(0, ) ( x σ 2 x 2 ) ± z 2 α/2 + σ2 + σ2 2 2 2 2 µη γνωστές µεγάλα z ( x x 2 ) (µ µ 2 ) σ N(0, ) ( x σ κανονική 2 x 2 ) ± z 2 α/2 + σ2 + σ2 2 2 2 2 γνωστές άγνωστες άνισες/ίσες άγνωστες ίσες άγνωστες ίσες άγνωστες άνισες µη κανονική µικρά µεγάλα z ( x x 2 ) (µ µ 2 ) s N(0, ) ( x s 2 x 2 ) ± z 2 α/2 + s2 + s2 2 2 2 2 κανονική µικρά t ( x x 2 ) (µ µ 2 ) µη κανονική s + 2 t + 2 2 ( x x 2 ) ± t + 2 2, α/2s µικρά µικρά + 2 Πίνακας 2.2: Εκτίµηση του διαστήµατος εµπιστοσύνης της διαφοράς µ µ 2 ανάλογα µε τη γνώση των διασπορών και κατανοµών των τ.µ. X και X 2 καθώς και των µεγεθών και 2 των αντιστοίχων δειγµάτων. το διάστηµα εµπιστοσύνης της µέσης τιµής (Πίνακας 2.) και για το διάστηµα εµπιστοσύνης της διαφοράς δύο µέσων τιµών (Πίνακας 2.2, οι έξι πρώτες σειρές). Για τη διαφορά µέσων τιµών υπάρχει ακόµα η περίπτωση των άνισων κι αγνώστων διασπορών σε συνδιασµό µε µικρά δείγµατα (τελευταία σειρά του Πίνακα 2.2) για την οποία δεν µπορούµε να καθορίσουµε την κατανοµή της εκτιµήτριας x x 2 και απ αυτήν να ϐρούµε το διάστηµα εµπιστοσύνης. Σ αυτήν την περίπτωση ούτε η µη παραµετρική εκτίµηση µπορεί να δώσει διάστηµα εµπιστοσύνης (για τη διάµεσο). Για το διάστηµα εµπιστοσύνης της διαφοράς µέσων τιµών υποθέσαµε οτι οι τ.µ. X και X 2 είναι ανεξάρτητες. ε ϑα ασχοληθούµε µε την περίπτωση που οι X και X 2 είναι εξαρτηµένες (όταν δηλαδή έχουµε Ϲευγαρωτές παρατηρήσεις) γιατί τέτοια προβλήµατα δεν παρουσιάζονται συχνά στη µηχανική.

44 ΚΕΦ ΑΛΑΙΟ 2. ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ 2.2.5 ιάστηµα της διαφοράς δύο αναλογιών p p 2 Η εκτίµηση διαστήµατος εµπιστοσύνης της διαφοράς δύο αναλογιών p p 2 παρουσιάζεται όταν ϑέλουµε να συγκρίνουµε δύο πληθυσµούς ως προς µια ιδιότητα, δηλαδή αν η αναλογία p των στοιχείων που πληρούν µια ιδιότητα στον ένα πληθυσµό είναι διαφορετική, κι αν ναι κατά πόσο, από την αντίστοιχη αναλογία p 2 του άλλου πληθυσµού. Για παράδειγµα, ϑέλουµε να δούµε κατά πόσο διαφέρει η αναλογία κοριτσιών στην Πολυτεχνική Σχολή και στη Φυσικο- µαθηµατική ή ϑέλουµε να διερευνήσουµε αν οι αναλογίες σκουριασµένων ϱαβδών χάλυβα σε δύο αποθήκες διαφέρουν και κατά πόσο. Η σηµειακή εκτίµηση της διαφοράς p p 2 δίνεται από τη διαφορά των ˆp = m και ˆp 2 = m 2 2, όπου m είναι το πλήθος επιτυχιών στο δείγµα µεγέθους από τον πρώτο πληθυσµό και m 2 είναι το πλήθος επιτυχιών στο δείγµα µεγέθους 2 από το δεύτερο πληθυσµό. Γνωρίζουµε ότι για µεγάλα και 2 η κατανοµή της εκτιµήτριας ˆp ˆp 2 είναι κανονική µε µέση τιµή E(ˆp ˆp 2 ) = p p 2 και διασπορά Var(ˆp ˆp 2 ) = p ( p ) + p 2( p 2 ) 2 κι άρα z (ˆp ˆp 2 ) (p p 2 ) p ( p ) + p 2( p 2 ) 2 N(0, ). Αντικαθιστώντας στον τύπο της διασποράς τις άγνωστες αναλογίες p και p 2 µε τις δειγµατικές εκτιµήσεις ˆp και ˆp 2 ϐρίσκουµε το ( α)% διάστηµα εµπιστοσύνης της διαφοράς p p 2 ˆp ( ˆp ) (ˆp ˆp 2 ) ± z α/2 + ˆp 2( ˆp 2 ). (2.23) 2 Για την εκτίµηση της διασποράς της εκτιµήτριας ˆp ˆp 2, µπορούµε να υποθέσουµε ότι οι αναλογίες p και p 2 δε διαφέρουν παρά πολύ έτσι ώστε να µπορούµε να χρησιµοποιήσουµε την εκτίµηση της κοινής αναλογίας ˆp που ορίζεται ως ˆp = ˆp + 2ˆp 2 + 2. Τότε η διασπορά της ˆp ˆp 2 δίνεται ως ˆp( ˆp)( + 2 ) και το διάστηµα εµπιστοσύνης της διαφοράς p p 2 δίνεται από τη σχέση ( (ˆp ˆp 2 ) ± z α/2 ˆp( ˆp) + ). (2.24) 2 Παράδειγµα 2.6 Για να εκτιµήσουµε αν υπάρχει διαφορά στο ποσοστό σκουριασµένων ϱαβδών χάλυβα δύο αποθηκών πήραµε ένα δείγµα 00 ϱαβδών από την πρώτη αποθήκη και ϐρήκαµε 2 σκουριασµένες κι ένα δείγµα 20 ϱαβδών από τη δεύτερη αποθήκη και ϐρήκαµε 26 σκουριασ- µένες. Η εκτίµηση από τα δείγµατα για τις αναλογίες σκουριασµένων ϱαβδών είναι ˆp = 2 = 0.2 00 για την πρώτη αποθήκη και ˆp 2 = 26 = 0.27 20 για τη δεύτερη αποθήκη. Η διαφορά είναι ˆp ˆp 2 = 0.097 (σε ποσοστό 9.7%) κι από το 95% διάστηµα εµπιστοσύνης µπορούµε να κρίνουµε αν είναι στατιστικά σηµαντική. Από τη σχέση (2.23) και για z α/2 =.96 ϐρίσκουµε 0.2 0.88 0.097 ±.96 + 00 0.27 0.783 20 [ 0.98, 0.004].

2.2. ΕΚΤ ΙΜΗΣΗ ΙΑΣΤ ΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣ ΥΝΗΣ 45 Το 95% διάστηµα εµπιστοσύνης περιέχει οριακά το µηδέν και γι αυτό συµπεραίνουµε πως µε αυτά τα δείγµατα και σ αυτό το επίπεδο εµπιστοσύνης η δειγµατική διαφορά των αναλογιών αν και είναι σε ποσοστό περίπου 0% δεν είναι στατιστικά σηµαντική. Φαίνεται όµως το ποσοστό σκουριασµένων ϱαβδών στη πρώτη αποθήκη να είναι µικρότερο. Ισως ϑα έπρεπε να αυξήσουµε το δείγµα µας και να πάρουµε έτσι στενότερο διάστηµα εµπιστοσύνης για να διαπιστώσουµε αν πράγµατι περιέχει το 0 ή όχι, αν δηλαδή η διαφορά των δύο αναλογιών είναι στατιστικά σηµαντική. Τα διαστήµατα εµπιστοσύνης, πέρα από το ότι δίνουν ένα εύρος τιµών για την παράµετρο που µελετάµε, µας δίνουν τη δυνατότητα να ελέγξουµε αν µια συγκεκριµένη τιµή της παραµέτρου είναι πιθανή ϐλέποντας αν ανήκει στο διάστηµα εµπιστοσύνης. Ετσι, στο τελευταίο παράδειγµα, ελέγχοντας αν η τιµή µηδέν ανήκει στο διάστηµα εµπιστοσύνης µας επιτρέπει στην ουσία να ελέγξουµε αν οι δύο αναλογίες διαφέρουν σηµαντικά ή όχι. Στο επόµενο κεφάλαιο ϑα παρουσιάσουµε τέτοιους στατιστικούς ελέγχους για τις ίδιες παραµέτρους για τις οποίες εκτιµήσαµε διαστήµατα εµπιστοσύνης.